iT邦幫忙

2025 iThome 鐵人賽

DAY 2
0
AI & Data

30 天了解 AI & Data:入門到實作系列 第 2

【DAY2】AI與Data的關係?

  • 分享至 

  • xImage
  •  

前言
昨天我們分別介紹了 AI 與 Data 的基本概念。今天,我們要更進一步,探討兩者之間的關係,說明為什麼資料是 AI 的基礎,以及 AI 如何透過資料發揮價值。


一、AI與人類大腦的學習方式

AI 的學習方式,其實很像人類大腦學習新事物的過程。

  • 人類大腦學習:

    以辨認動物為例,當我們第一次看到一隻貓,大腦可能只知道「這是一個有毛的生物」,但還不清楚牠的特徵或名稱。

    接著,我們會觀察不同的貓或圖片(大隻的、小隻的、黑貓、白貓、花貓......),大腦會注意到貓咪的共通特徵(Features),例如:尖尖的耳朵、長長的鬍鬚、圓圓的眼睛、柔軟的毛皮、彎曲的尾巴......
    這些特徵幫助大腦建立「貓咪概念」,即使看到新的貓咪,顏色或大小不同,也能正確辨認。

    同時,大人或老師會告訴我們「這是貓咪」,幫助大腦把特徵與名稱建立連結。經過反覆觀察與經驗累積,大腦就能辨認出新的貓咪,即使牠的顏色或形狀不同,也能自信判斷。

  • AI的學習方式:

    AI 的學習過程模仿人腦,但依靠資料(Data)與演算法(Algorithm)。

    同樣以辨認動物為例,訓練 AI 來辨認貓咪的過程,其實很像人類學習的過程,過程如下。

    1.資料收集(Data Collection):準備大量貓咪圖片,並丟給 AI 很多圖片,並告訴它「這是貓」或「不是貓」。

    2.特徵提取(Feature Extraction):AI 自動提取共通特徵,例如耳朵形狀、毛色分布、眼睛位置,這些特徵幫助 AI 建立「貓咪概念」。

    3.模型訓練(Model Training):AI 透過演算法(Algorithm)學習如何依據特徵判斷是否為貓。且會調整模型的 權重(Weights) 來降低錯誤率。

    4.測試與調整(Validation & Tuning):用新的圖片測試 AI 是否能正確辨認貓,必要時調整模型。

    5.推論與應用(Inference & Deployment):訓練完成後,AI 可以對新圖片做推論,即使貓的外觀不同,也能辨認出來。

  • 非 AI 程式學習辨認動物的方法

    [方法一]規則導向(Rule-based Approach):程式設計師需要手動定義規則,告訴程式如何辨認動物。
    例如:如果耳朵尖且有鬍鬚,且體型小於50公分 → 判斷為貓
    優點:邏輯明確、對固定情況準確
    缺點:無法應對未定義的情況,例如貓咪姿勢、角度或光線不同時就可能錯誤

    [方法二]特徵比對(Feature Matching):程式先抓取圖像的特徵(顏色、形狀、邊緣等),再比對已知模板。
    例如:比較圖片中耳朵、眼睛、毛色與模板的相似度。
    優點:比純規則彈性稍高
    缺點:模板需要人工設計,對光線、角度、背景變化敏感

    以上方法之特徵與判斷邏輯都是人工指定,程式不會自行學習

二、AI 與 Data 的關係
透過辨認動物的例子,我們可以清楚看到 AI 與 Data 的關係:

1.Data是AI學習的基礎

  • 就像小孩要學會辨認貓咪,需要看很多貓的圖片,AI 也需要大量資料(Data)來學習。

  • 這些資料可以是圖片、文字、聲音……只要是 AI 可以分析的資訊,都能作為學習素材。

2.Data提供特徵

  • AI 透過資料找出共通特徵(Features),例如貓的尖耳朵、鬍鬚、眼睛位置等。

  • 如果資料不夠多樣化或不完整,AI 很難學會正確的判斷,就像小孩只看過黑貓,可能看見白貓就認不出來一樣。

3.Data決定AI模型表現

  • 模型(Model)學到的規則,是從Data中學習來的。Data越完整、越正確,模型就越精準。

  • 標註資料(Labelled Data)告訴 AI「這是貓」或「不是貓」,就像老師告訴小孩動物的名稱一樣,幫助 AI 建立正確的概念。

4.AI 是Data的運用

  • 有了資料,AI 才能透過演算法(Algorithm)分析特徵、建立模型、進行推論(Inference)。

  • 沒有資料,AI 就像沒有經驗的小孩,看再多的動物也學不會辨認。

三、名詞解釋

  • 資料(Data):未整理的原始資訊,如數字、文字、圖片或聲音,AI 用來學習。
  • 演算法(Algorithm):解決問題的方法或步驟,AI 用來分析資料與學習規律。
  • 特徵(Feature):可以幫助辨識的屬性,例如貓的耳朵形狀、毛色、眼睛。
  • 模型(Model):AI 學習後建立的判斷規則集合,用來對新資料做判斷。
  • 權重(Weights):模型中各特徵的重要程度,AI 會調整權重來降低錯誤。
  • 標註資料(Labelled Data):已經標明答案的資料,例如圖片標註「貓」或「不是貓」,供 AI 訓練。
  • 推論(Inference):使用訓練好的模型對新資料做判斷或預測。
  • 驗證與調整(Validation & Tuning):檢查模型準確度,必要時調整權重或模型,提高表現。

小結
今天我們透過學習辨認動物的例子,理解了 AI 的訓練需要通過資料(Data)來學習。資料提供了特徵(Features),幫助 AI 建立模型(Model)與概念,就像小孩透過觀察和老師的指導學會辨認貓咪一樣。

我們也了解到,資料的完整性與多樣性會影響 AI 模型的準確度。同時,本節也對一些核心名詞做了簡短說明。

理解了這些概念後,後續章節將從機器學習與深度學習開始,逐步說明如何將資料轉化為能做出判斷的模型。


上一篇
【DAY1】AI &Data 是什麼?
下一篇
【DAY3】什麼是 AI、機器學習 (ML)、深度學習 (DL)?快速掌握三者差異
系列文
30 天了解 AI & Data:入門到實作3
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言